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摘 要 :虚拟 机 放置 是 虚拟 机 整合 过 程 中 的 关键 步骤 ,虚拟 机 放置 方法 的 好 坏 往往 会 影响 云 数 据 中 心 的 资源 使 用 效率 和 性 
能 ,这 类 问题 可 以 通过 建立 多 目标 优化 模型 来 进行 求解 。 当 前 云 数 据 中 心 存在 能 耗 高 .资源 利用 率 较 低 以 及 资源 碎片 化 的 
情况 。 针 对 上 述 情况 ,提出 了 一 种 基于 MALO 算法 的 虚拟 机 放置 策略 。 通 过 建立 多 目标 多 约束 的 虚拟 机 放置 模型 ,对 能 
耗 、 资 源 利 用 率 和 资源 碎片 化 3 个 方面 进行 优化 。 并 且 在 蚁 狮 算 法 的 基础 上 ,通过 改进 解 空 间 的 边界 变化 策略 和 蚂蚁 随机 
游 走 的 位 置 选 择 策略 ,最 后 对 蚂蚁 位 置 越界 进行 修正 ,使 得 种 群 的 多 样 性 能 得 到 更 好 保证 ,这 样 能 更 好 地 跳出 局 部 最 优 解 。 
与 于 虚拟 机 放置 平台 对 MALO 算法 和 另外 4 种 虚拟 机 放置 算法 进行 仿真 实验 ,实验 结果 表明 , 相 比 于 蚊 狮 算法 .BRC 算 
GB.MBFD 算法 和 FFD 算 法 ,MALO 算法 在 降低 能 耗 提 高 资源 利用 率 以 及 减少 资源 碎片 化 方面 有 一 定 的 提升 效果 。 
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Abstract: Virtual machine placement is a key step in the process of virtual machine consolidation. The quality of the virtual 


Hachine placement method usually affects the resource utilization efficiency and performance of the cloud data center. Such 


和 rpblems can be solved by establishing a multi-objective optimization model. Currently, cloud data centers have high energy 
kehsumption， low resource utilization, and resource fragmentation. In view of the above situation, a virtual machine place- 
ment strategy based on MALO algorithm is proposed. By establishing a multi-objective and multi-constrained virtual ma- 
chine placement model, the energy consumption, resource utilization, and resource fragmentation are optimized. And on the 
basis of the Antlion algorithm, by improving the boundary change strategy of the solution space and the location selection 
strategy of ants random walk, finally the position of the ants is corrected beyond the boundary, so that the diversity of the 
population can be better guaranteed, which can better Jump out of the local optimal solution. Based on the virtual machine 
placement platform, the simulation experiments of MALO algorithm and four other virtual machine placement algorithms 
are carried out. The experimental results show that compared to the Antlion algorithm, BRC algorithm, MBFD algorithm 
and FFD algorithm, the MALO algorithm has a certain improvement effect in reducing energy consumption, improving re- 
source utilization and reducing resource fragmentation. 
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云 计算 已 经 成 为 信息 行业 的 主要 计算 模式 , 它 可 
以 根据 用 户 的 需求 来 提供 相关 的 计算 资源 ,用 户 不 需 
要 关注 基础 设施 内 部 的 更 新 和 维护 细节 "0 。 这 样 提 
供 资源 的 云 服务 提供 商 就 与 需要 计算 资源 的 客户 建 
立 了 联系 ,形成 了 一 条 供应 链 ,在 虚拟 化 技术 的 基础 
上 通过 虚拟 机 和 物理 机 的 映射 关系 来 满足 用 户 的 需 
求 中 。 随 着 云 计算 的 发 展 ,虚拟 化 技术 成 为 了 人 们 关 
注 的 重点 。 通 过 虚拟 化 技术 ,可 以 把 软件 资源 和 硬件 
资源 结合 起 来 ,在 成 本 开销 相对 较 少 的 情况 下 满足 用 
户 的 计算 需求 中。 

云 数据 中 心 的 能 源 问题 一 直 是 一 个 至 关 重 要 的 
问题 , 它 对 环境 和 成 本 会 产生 直接 的 影响 中 。 能 源 消 
耗 、 二 氧化 碳 等 问题 在 不 断 产生 ,使 得 云 数据 中 心 的 
能 源 管理 面临 更 大 的 挑战 。 对 于 大 型 的 云 数据 中 心 ， 
能 源 消耗 不 可 忽视 。 物 理 机 所 产生 的 能 源 消耗 约 占 
疙 体能 源 消耗 的 60%。 一 台 物 理 机 所 产生 的 的 能 
羊 楼 由 其 资源 上 限 以 及 部 署 在 物理 机 上 的 虚拟 机 请 
求 芭 源 的 总 和 所 决定 。 在 通常 情况 下 ,一 台 空闲 的 
物理 机 产生 的 功 耗 占 它 最 大 功 耗 的 70%5 ,因此 对 
读数 据 中 心 的 物理 机 功 耗 进行 控制 ,减少 空闲 物理 机 
的 数量 至 关 重 要 。Beloglazov 等 中 指出 好 的 虚拟 机 
放 惫 策略 能 有 效 减少 能 耗 , 并且 提高 QoS。 通 过 优 
做 量 拟 机 放置 策略 ,可 以 将 虚拟 机 更 多 地 放置 在 资源 
利 表率 更 高 的 物理 机 上 ,同时 将 空闲 虚拟 机 关闭 ,能 
够 最 大 限度 地 减少 活动 物理 机 的 数量 ,从 而 降低 能 
耗 吧 除 此 之 外 ,虚拟 机 放置 的 不 合理 会 导致 剩余 资源 
不 殉 衡 ,进而 产生 资源 碎片 ,大 量 资源 碎片 的 产生 则 
会 造成 数据 中 心 效率 的 低下 四。 因此 ,在 虚拟 机 放置 
的 过 程 中 ,充分 考虑 各 台 物 理 机 的 负载 均衡 ,有 助 于 
减少 资源 碎片 ,使 得 数据 中 心 的 资源 使 用 更 加 高 效 。 

Jangiti 等 中 提出 了 一 种 基于 资源 比率 的 PM 选 
择 算法 PMNeAR ,该 算法 会 根据 虚拟 机 请 求 CPU 资 
源 与 内 存 资源 的 比例 将 该 虚拟 机 放置 在 剩余 CPU 
和 内 存 比例 最 接近 的 物理 机 上 ,在 减少 资源 消耗 方面 
相 比 其 他 算法 有 一 定 的 提升 效果 。Tarafdar 等 "" 提 
出 了 一 种 能 耗 和 服务 质量 感知 的 虚拟 机 整合 算法 
PEQC ,通过 马尔 可 夫 模 型 预测 出 空闲 和 过 载 物理 机 ， 
并 对 它们 进行 迁移 , 旨 在 保证 服务 质量 的 前 提 下 降低 
数据 中 心 的 能 耗 ,该 算法 在 降低 能 耗 、 保 证 服务 质量 
和 减少 迁移 次 数 方面 有 一 定 的 效果 。Farahnakian 
等 中 提出 了 一 种 UPBFD 算法 ,并 使 用 kk- 近邻 回归 
模型 对 资源 使 用 率 进 行 预测 ,将 过 载 物理 机 上 的 虚拟 
机 进行 迁移 ,该 算法 在 减少 能 耗 , 迁 移 次 数 和 SLA 韦 
反 次 数 上 有 一 定 优 势 。 上 述 近 似 算法 在 求解 过 程 中 
有 时 间 开 销 小 的 优点 ,但 是 近似 算法 通常 是 根据 当前 


状态 得 到 一 个 最 优 解 , 这 个 解 不 一 定 是 全 局 最 优 解 。 
文献 [12-16j 采 用 智能 优化 算法 进行 求解 ,智能 优化 
算法 是 通过 全 局 搜索 来 找到 可 行 解 。 在 多 目标 优化 
过 程 中 ,一 般 是 将 多 个 目标 通过 线性 加 权 的 方式 整合 
成 一 个 优化 目标 ,再 通过 智能 优化 算法 进行 求解 。 
Parvizi 等 "2 针对 能 耗 .资源 利用 率 、 活 动物 理 机 数量 
进行 优化 ,在 引入 非 线性 凸 优化 解 后 ,提出 了 一 种 非 
支配 排序 遗传 算法 ,在 与 其 他 基础 算法 比较 中 有 一 定 
的 提升 。 菌 凯 青 等 "提出 了 一 种 基于 离散 蝙 晤 算法 
的 虚拟 机 放置 算法 (DBA-VMP) ,对 经 由 蝙 旺 算法 进 
行 改 进 。 相 比 其 他 几 种 多 目标 优化 的 VMP 算法 ,该 
算法 在 保证 QoS 的 前 提 下 在 降低 能 耗 和 提高 资源 利 
用 率 两 方面 取得 了 一 定 的 效果 ,但 是 未 对 QoS 做 出 
进一步 优化 。 李 双 俐 等 " 提出 了 一 种 基于 Memetic 
的 虚拟 机 放置 方法 ,首先 对 虚拟 机 的 请 求 进 行 分 类 ， 
然后 通过 改进 的 Memetic 算法 进行 求解 ,除了 在 降 
低能 耗 、 提 高 资源 利用 率 和 保证 QoS 上 有 一 定 的 提 
升 效 果 ,计算 时 间 开 销 相 比 其 他 智能 算法 也 有 一 定 程 
度 的 减 小 。 马 小 晋 等 55 在 模拟 退火 算法 的 基础 上 进 
行 改 进 , 提 出 了 一 种 基于 改进 模拟 退火 算法 的 虚拟 机 
调度 方法 ,针对 资源 利用 率 、 执 行 成 本 和 负载 均衡 这 
3 个 目标 进行 多 目标 优化 。 为 了 避免 陷入 局 部 最 优 ， 
引入 了 并 行 的 思想 ,根据 执行 成 本 和 执行 性 能 生成 两 
组 解 并 进行 迭代 ,最 终 效果 有 一 定 提升 。Tang 等 
提出 了 一 种 混合 遗传 算法 , 它 不 仅 考虑 了 物理 机 的 能 
耗 ,还 考虑 了 通信 网 络 的 能 耗 , 相 比 于 普通 遗传 算法 
有 着 更 高 的 性 能 和 效率 。 以 上 这 些 研 究 大 多 是 针对 
能 耗 、 资 源 利 用 率 进行 优化 。 但 在 虚拟 机 放置 的 过 程 
中 ,不 合理 的 放置 造成 大 量 资源 碎片 的 产生 也 同样 会 
导致 能 耗 较 高 .资源 利用 率 低 下 的 问题 。 因 此 ,文献 
[17-18] 主 要 将 资源 的 负载 均衡 及 资源 碎片 最 小 化 作 
为 优化 目标 。Li 等 "提出 了 一 种 基于 BBO 算法 的 
多 目标 虚拟 机 放置 算法 ,针对 CPU ,内存 和 带宽 资源 
的 负载 均衡 进行 优化 ,同时 考虑 物理 机 之 间 的 负载 均 
衡 及 单个 物理 机 内 部 的 负载 均衡 ,取得 了 一 定 的 效 
果 。Ghasemi 等 中 提出 了 一 种 基于 负载 均衡 的 多 目 
标 虚拟 机 放置 算法 ,该 算法 使 用 了 强化 学 习 的 方法 ， 
除了 关注 物理 机 内 部 的 资源 平衡 ,还 关注 物理 机 之 间 
的 负载 均衡 ,这 样 能 使 资源 分 布 更 加 均衡 的 同时 减少 
运行 时 间 。 

上 述 研 究 中 存在 一 些 不 足 ,例如 在 用 启发 式 算法 
进行 求解 时 ,大 多 数 只 考虑 了 能 耗 、 资 源 利 用 率 ,很 少 
考虑 资源 碎片 的 问题 ,而 资源 碎片 也 是 虚拟 机 放置 中 
的 一 个 关键 指标 ,关系 着 虚拟 机 整合 效果 的 好 坏 , 且 
这 类 算法 很 容易 陷入 局 部 最 优 解 。 因 此 ,提出 一 种 基 
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于 蚁 狮 算法 的 虚拟 机 放置 算法 (MALO)。 通 过 对 传 型 为 : 
统 蚁 狮 算法 进行 调整 ,使 得 种 群 的 随机 性 和 多 样 性 大 P;= hw hw — ohP i)y,, (4) 
大 提升 ,能 有 效 避 免 聊 入 局 部 最 优 解 。 
Bo tal 一 -> Pie (5) 
1 模型 设计 其 中 :a 表示 空闲 物理 机 占 满载 物理 机 功 耗 的 百 分 


1.1 虚拟 机 放置 问题 定义 


虚拟 机 放置 问题 实质 上 可 看 作 一 个 多 维 装 箱 问 
题 ,也 是 NP hard 问题 。 假 设 云 数 据 中 心 有 m 台 虚 
拟 机 、n 台 物 理 机 ,虚拟 机 放置 问题 也 就 是 通过 合理 
的 调度 策略 将 m 台 虚 拟 机 放置 在 ” 台 物 理 机 上 , 且 
满足 一 定 的 约束 条 件 。 问 题 定义 如 下 : 

数据 中 心中 mx 台 虚 拟 机 组 成 一 个 虚拟 机 列表 
VE(Vi ,Vs V,) ,7 台 物 理 机 组 成 一 个 物理 机 列 
表 订 =={h1,h;,…,h,)。 规 定 每 台 虚 拟 机 请 求 的 资 
源 及 物理 机 的 资源 包括 CPU 和 内 存 2 种。 第 i 台 虚 
控 机 请 求 资源 为 R， 二 (ui,w;), 其中: ww 表示 第 i 台 
虚拟 机 请 求 的 CPU 资源 ; ww; 表示 第 i 台 虚 拟 机 请 求 
的 内 存 资源 。 数据 中 心 物理 机 的 CPU 资源 容量 列 
为 R,, 二 {ci1,c，,… ,Cc,), 其 中 < 表示 第 j 台 物 理 
桩 铅 CPU 资源 容 和. 数据 心理 机 的 内 存 
容量 列表 为 Rem 0 …,71,}, 其 中 1; 表示 
总 六 台 物 理 机 的 内 存 资源 容量 。 a 


下 药 束 条件 ， 
.i (1) 
和 1 
ee DX Cy, (2) 
2 1 一 1 
Xsw; Sm,. (3) 
i=1 
其 中 :i 二 1,2，,: ”71 ,7 一 1， ys »7; X; 表示 虚拟 机 


V; 是 否 放 在 物理 机 h; 上 , 它 有 2 种 取 值 1 和 0,1 表 
示 虚 拟 机 V; 放 在 物理 机 h; 上 ,0 表示 虚拟 机 V; 未 放 
在 物理 机 有 h; 上 。 式 (1) 表 示 一 台 虚 拟 机 最 多 只 能 放 
置 在 一 台 物 理 机 上 , 式 (2) 和 式 (3) 表 示 所 有 虚拟 机 请 
求 的 CPU 和 内 存 资源 总 量 不 能 超过 当前 物理 机 
CPU 和 内 存 资 源 总 量 


1.2 能 耗 模型 


当前 数据 中 心 的 高 能 耗 问题 已 经 引起 了 足够 的 
重视 ,如 何 降低 能 耗 已 成 为 研究 者 研究 的 重点 问题 。 
假设 当前 数据 中 心 有 m 台 虚 拟 机 和 台 物 理 机 ,第 ; 
台 物 理 机 久 , 处 于 满载 状态 时 的 功 耗 为 LM , 当前 
的 CPU 利用 率 为 上 8 。 在 通常 情况 下 ,可 认为 物 
理 机 的 功 耗 与 其 CPU 利用 率 呈 正 相 关 关 系 , 能 耗 模 


比 ,a 的 范围 一 般 在 0. 6 一 0.7, 本 研究 统一 取 0.7; y; 
表示 第 i 台 物 理 机 是 否 为 活动 物理 机 , 它 的 取 值 为 0 
或 者 1,1 表示 活动 物理 机 ,0 表示 非 活 动物 理 机 ; 
Fa 表示 的 是 数据 中 心 的 总 能 耗 ,在 完成 虚拟 机 的 
放置 时 ,默认 当前 时 刻 的 总 功 耗 值 为 数据 中 心 所 有 物 
理 机 产生 的 能 耗 。 


1.3 资源 使 用 率 模型 


假如 当前 数据 中 心 有 mx 台 虚 拟 机 和 7 台 活 动物 
理 机 ,资源 使 用 率 包 括 CPU 和 内 存 资源 的 平均 资源 
使 用 率 2 种 , 且 在 计算 时 只 考虑 活动 物理 机 , 而 不 考 


虑 负载 为 0 的 物理 机 。 资 源 使 用 率 模型 为 

1 Our;, (6) 

i=1 

D3 (h Seu / 有 pe ) 
hPa 一 | . (7) 
n 

= 2) wr;, (8) 

1 一 1 


mem av 
he 


n 
sed a 
> [Gi De / 万 un x) 
j= 二 1 
= (9) 
n 


其 中 : zx; 表示 第 i 台 虚 拟 机 是 否 放 置 在 第 j 台 物 理 
机 上 , 它 有 2 个 取 值 0 或 者 1, 取 值 1 表示 第 i 台 虚 拟 
机 放置 在 第 j 台 物 理 机 上 ,反之 则 取 值 为 0; 4 
和 疡 Poe 分 别 表示 第 j 台 物 理 机 的 CPU 和 内 存 资 
源 上 限 ; h%™*™ 表示 第 7 台 物 理 机 上 放置 的 所 有 虚 
拟 机 请 求 的 CPU 资源 总 量 ; h4 ”表示 所 有 活动 物 
理 机 的 平均 CPU 资源 利用 率 ; h>™”* 表示 第 j 台 物 
理 机 上 放置 的 所 有 虚拟 机 请 求 的 内 存 资源 总 总 量 ; 
h™™w% 表示 所 有 活动 物理 机 的 平均 内 存 资源 利 
用 率 。 


1.4 资源 平衡 度 模 型 


假设 数据 中 心 有 m 台 虚 拟 机 和 ?7 人 台 物 理 机 ,为 
了 使 虚拟 机 的 放置 更 加 均衡 ,提出 了 一 种 基于 比值 的 
资源 平衡 度 的 模型 , 当 一 台 物 理 机 的 CPU 利用 率 和 
内 存 利 用 率 的 比值 越 接近 于 1 时 , 则 代表 这 台 物 理 机 
的 资源 利用 更 加 均衡 。 数 据 中 心 的 资源 平衡 度 模型 为 
hi 


= 
| 六 De nt 
1 9 ( 10 ) 
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其 中 : Ag 表示 第 i 台 物 理 机 的 CPU 利用 率 ; 
Am 表示 第 i 台 物 理 机 的 内 存 利用 率 。 


1.5 资源 碎片 模型 


在 当前 数据 中 心 ,不 合理 的 虚拟 机 放置 策略 可 能 
会 造成 资源 碎片 的 产生 ,资源 碎片 即 物理 机 上 CPU 
资源 和 内 存 资 源 不 平衡 ,导致 剩余 资源 无 法 再 满足 新 
的 虚拟 机 请 求 , 随 着 资源 碎片 的 累积 ,会 造成 资源 利 
用 率 低下 及 资源 的 浪费 。 资 源 碎 片 定义 为 


了 一 >， h ye » (11) 

$= 
st. hP "1andh”™ <<512, (12) 
了 Ea > h 2 9 (13) 

1 一 1 


pz st hP "landh ”512, (14) 
其 申 : /ww 表示 CPU 资源 碎片 ; f wo 表示 内 存 资 源 
碎 邮 ; h”" 表示 第 i 台 物 理 机 的 CPU 剩余 量 ; 
hE 表示 第 i 台 物理 机 的 内 存 剩余 量 。y; 表示 是 


利用 启发 式 算法 来 求解 ,如 蚁 群 算法 、 遗 传 算法 及 粒 
子 群 算法 等 。 蚁 狮 优化 算法 Cantlion optimization， 
简称 ALO) 具 有 简单 .调节 参数 少 ,和 鲁 棒 性 比较 强 等 
优点 ,在 求解 一 些 复 杂 问 题 时 有 一 定 优势 ,但 也 存在 
不 足 , 主 要 是 易 收 敛 过 快 ,难以 跳出 局 部 最 优 解 。 
此 ,为 了 解决 这 类 问题 ,需要 对 ALO 算法 的 相关 步 
又 进行 改进 。 

蚁 狮 优化 算法 的 步骤 如 下 : 

Stepl :初始 化 算法 的 参数 。 种 群 的 大 小 为 N， 
迭代 次 数 为 荆 , 解 的 维度 为 dim, 解 的 上 界 和 下 界 分 
别 为 6,,01。 对 NN 个 蚂蚁 和 蚁 狮 的 位 置 进行 随机 初 
始 化 : 


X;,; =01 二 rand(b, 一 01)。 (16) 
其 中 : X,,; 表示 第 i 个 种 群 个 体 的 第 j 维 进行 初始 
化 ,i 二 1,2,…,NN,j 二 1,2,…,d。 将 蚂蚁 的 位 置 和 
蚁 狮 的 位 置 保存 在 矩阵 中 ,根据 目标 函数 计算 出 每 个 
个 体 的 适应 度 ,并 按 适 应 度 进行 排序 ,适应 度 最 优 的 


否 满足 式 (12) 和 式 (14) 资 源 碎片 的 条 件 , 如 果 满足 


好 为 1, 否则 为 0。 
CN 
虚拟 机 放置 目标 函数 


CN 一 个 数据 中 心 的 虚拟 机 是 否 高 效 、 合 理 ,关键 是 
能 耕 降 低能 耗 、 提 升 资源 利用 率 , 并 减少 资源 碎片 的 
疡 生 。 低 能 耗 和 高 资源 利用 率 能 使 数据 中 心 的 成 本 
降 慨 。 而 虚拟 机 放置 是 否 平衡 同样 影响 着 数据 中 心 
的 高 效 性 ,如 果 服 务 器 上 资源 放置 不 平衡 ,会 导致 次 
源 绎 片 的 产生 。 
二 根据 上 述 分 析 , 优 化 目标 主要 是 最 小 化 能 耗 、 资 
源 碎片 ,最 大 化 资源 利用 率 。 虚 拟 机 放置 目标 函数 为 
F=min(E,L)=L+rE, (15) 

其 中 :F 表示 目标 函数 的 适应 度 函 数值 ,这 里 先 将 能 
耗 和 资源 平衡 度 进行 归 一 化 ,再 通过 加 权 的 方式 将 多 
个 目标 整合 成 单 目标 ;r 表示 一 个 参数 , 当 7 值 越 大 ， 
表示 能 耗 占 的 比重 更 大 , 主要 考虑 降低 能 耗 ,反之 则 
表示 资源 平衡 度 占 的 比重 更 大 , 主要 考虑 虚拟 机 放置 
更 加 平衡 ,减少 资源 碎片 。 为 了 平衡 能 耗 和 资源 平衡 
度 的 影响 ,将 > 的 值 设 为 0.5, 此 时 能 取得 更 好 的 放 
置 效果 。 
2 ”基于 改进 蚁 狮 算法 (MALO) 的 虚拟 机 放置 
方法 

本 质 上 来 说 ,虚拟 机 放置 问题 是 一 个 非 线性 的 优 


化 问题 , 它 产 生 的 解 是 离散 式 的 ,因此 不 适合 用 一 般 
的 数学 方法 求解 。 在 大 多 数 情况 下 ,虚拟 机 放置 问题 


位 置 即 为 精英 蚁 狮 的 位 置 。 

Step2 :通过 轮 盘 赌 策略 选择 蚁 狮 ,不 同位 置 的 蚊 
狮 被 选中 的 概率 也 不 一 样 ,一 般 来 说 适应 度 越 好 ,被 
选中 的 概率 越 大 。 

Step3 :蚂蚁 围绕 轮 盘 赌 策略 选择 的 蚁 狮 和 精英 
蚁 狮 进行 随机 游 走 ,随机 游 走 的 方向 和 距离 由 随机 画 
数控 制 。 随 着 迭代 次 数 的 不 断 增加 ,蚂蚁 随机 游 走 的 
边界 也 在 不 断 缩 小 , 越 来 越 接 近 最 优 解 ,边界 变化 如 
式 (17) 所 示 。 最 后 对 蚂蚁 的 位 置 进行 更 新 ,如 式 (19) 
所 示 。 


了 一 10 Xx 二。 (17) 


2,t > 0.1T7,， 
人 
W=44, 1 > 0.75T, (18) 
St > 0.91, 
6 7 > 0.957, 
，_ Ka+RE 
A 一 7 。 
其 中 :I 随 着 迭代 次 数 的 增加 而 增 大 ;z 为 当前 迭代 次 
数 ;T 为 总 迭代 次 数 ;W 的 值 由 当前 迭代 次 数 决定 ; 
A; 表示 第 i 个 蚂蚁 在 第 t 次 迭代 中 的 位 置 ; R% 表示 
由 轮 盘 赌 选择 的 蚁 狮 在 第 7 次 迭代 中 的 位 置 ; RE 表 
示 精 英 蚁 狮 在 第 1 次 迭代 中 的 位 置 。 
Step4: 在 蚂蚁 位 置 更 新 后 会 计算 当前 蚂 尽 的 适 
应 度 , 若 当前 蚂 尽 的 适应 度 优 于 当前 蚁 狮 , 则 蚁 狮 会 
捕获 蚂蚁 ,并 将 蚁 狮 的 位 置 更 新 为 蚂蚁 的 位 置 。 
Step5 :迭代 次 数 递增 , 若 当 前 迭代 次 数 达 到 最 大 


(19) 
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夫 代 次 数 , 则 输出 精英 蚁 狮 的 位 置 , 即 为 全 局 最 优 解 ; 
否则 ,重复 Step2 到 Step5 ,直到 满足 条 件 为 止 。 

针对 ALO 算法 容易 产生 的 问题 ,提出 了 一 种 改 
进 的 改 狮 算法 (modified antlion optimization , 简称 
MALO)。 算 法 的 主要 流程 如 下 : 

输入 :vmList，pmList 

输出 :Pos_Elite 

工 :最 大 迭代 次 数 ;iter: 当前 迭代 次 数 ; N :种 群 
数量 ; 

Pos_Ant: 蚂 蚁 位 置 ;Pos_Antlion: 蚁 狮 位 置 ; 

Pos_EFlite: 精 英 蚁 狮 位 置 ; 

Stepl :按照 式 (16) 初 始 化 N 个 蚂蚁 和 蚁 狮 个 体 
的 位 置 。 

过 Step2: 计 算 每 个 蚁 狮 个 体 的 适应 度 函 数值 ,并 按 
短语 度 函 数值 从 小 到 大 排序 ,适应 度 值 最 小 的 个 体位 
壁 即 为 Pos_Elite。 

已 Step3: 若 iter 之 了 ,进行 送 代 , 在 迭代 过 程 中 边 
罪 的 变化 如 式 (20) 所 示 , 每 个 蚂蚁 个 体会 围绕 轮 盘 赌 
策略 选择 出 的 蚁 狮 以 及 Pos_Elite 进行 式 (22) 所 示 
的 随机 游 走 。 若 此 时 Pos_Ant>bu 或 者 Pos_Ant< 
be 则 Pos_Ant 会 按照 式 (23) 进 行 更 新 。 

© Step4: 计 算 Pos_Ant 的 适应 度 函 数值 , 特 小 于 
P63 Antlion 的 适应 度 函 数值 , 则 将 Pos_Antlion 更 
新 为 Pos_Ant。 

>< Step5: 若 iter 二 全 , 则 跳 转 到 Step6 ,否则 ,iter 十 
-0 吕 k 转 到 Step3 继续 循环 。 

:三 Step6: 此 时 Pos_Elite 即 为 虚拟 机 放置 的 最 终 方 
案 6 输 出 结果 。 


2.1 边界 自 适 应 调整 机 制 


在 传统 蚁 狮 算法 中 ,蚂蚁 跟随 蚁 狮 随 机 游 走 的 边 
界 是 不 断 变 化 的 , 随 着 迭代 次 数 的 增加 , 它 的 上 界 和 
下 界 不 断 收 缩 。 但 是 边界 变化 的 趋势 是 线性 的 , 即 所 
有 蚂蚁 个 体 在 游 走 过 程 中 边界 变化 趋势 完全 一 致 。 
这 种 边界 变化 机 制 不 适用 于 云 环 境 编码 , 它 可 能 会 
坏 种 群 解 的 多 样 性 , 且 易 陷入 局 部 最 优 解 ,不 利于 全 
局 寻 优 。 因 此 ,提出 了 一 种 边界 自 适 应 调整 机 制 , 通 
过 改进 式 (17) ,使 得 蚂蚁 进行 随机 游 走时 解 的 多 样 性 
更 加 丰富 。 


I 一 r 十 10” X 示 X (0.5+logz(1 十 示 Xrand) )， 


(20) 

r=N,/N,. (21) 
其 中 :r 表示 当前 迭代 次 数 待 放置 的 虚拟 机 数量 和 物 
理 机 数量 的 比值 ;t 表示 当前 迭代 次 数 ;T 表示 总 迭 


代 次 数 ;vw 的 大 小 随 着 当前 迭代 次 数 的 变化 而 变化 ， 
当前 迭代 次 数 越 大 ,w 的 值 越 大 ; rand 表示 (0,1) 区 
间 的 一 个 随机 数 。 蚂 蚁 随机 游 走 的 边界 主要 由 了 来 
决定 ,并 且 与 1 值 呈 反 比 。 了 的 值 是 随 着 近 代 次 数 的 
增加 而 动态 变化 的 。 


2.2 ”蚂蚁 位 置 更 新 策略 


蚂蚁 随 机 游 走 的 位 置 根据 轮 盘 赌 策 略 选择 出 的 
蚁 狮 及 精英 蚁 狮 的 位 置 确 定 。 在 传统 蚁 狮 算法 中 , 蚂 
蚁 最 终 游 走 的 位 置 是 轮 盘 赌 选择 的 蚁 狮 和 精英 蚁 狮 
位 置 的 中 点 ,这 样 会 造成 多 数 蚂蚁 游 走 的 趋势 保持 一 
致 ,破坏 了 种 群 的 多 样 性 。 对 蚂蚁 随机 游 走 的 位 置 进 
行 改 进 , 使 得 在 迭代 的 不 同时 期 ,蚂蚁 游 走 具有 不 同 
的 趋势 。 当 迭代 次 数 较 少时 ,蚂蚁 偏 向 轮 盘 赌 选 择 的 
蚁 狮 进行 随机 游 走 ,而 在 算法 后 期 , 蚂 收 更 偏向 精英 
蚁 狮 进行 随机 游 走 。 这 种 策略 使 多 蚁 的 游 走 更 具 随 
机 性 ,也 在 一 定 程度 上 保证 了 种 群 的 多 样 性 。 改 进 后 
的 蚂蚁 位 置 更 新 策略 为 


A{ 一 RA 十 (RE 一 RA) X (Xrand+0.2)。 


(22) 
其 中 : A'; 表示 第 i 只 蚂蚁 在 第 上 次 迭代 时 的 位 置 ; 
Rs 表示 第 上 次 迭代 时 轮 盘 赌 选择 的 蚁 狮 的 位 置 ; RE 
表示 第 1 次 迭代 时 精英 蚁 狮 的 位 置 ;t 表示 当前 的 迭 
代 次 数 ; 工 表示 总 的 迭代 次 数 。 
当 蚂蚁 完成 随机 游 走 后 ,如 果 此 时 蚂蚁 的 位 置 大 
于 上 界 或 者 小 于 下 界 ,会 将 蚂蚁 个 体 移动 到 边界 上 ， 
但 这 样 显然 不 利于 种 群 的 多 样 性 ,可 能 会 造成 一 些 个 
体 集 中 在 同一 位 置 。 因 此 ,对 这 种 情况 进行 改进 ,如 
果 蚂 蚁 个 体 越界 ,位 置 会 按 式 (23) 进 行 更 新 ,保证 随 
机 性 。 
Pos_Ant=0| 二 (0,—01) X rand, (23) 


3 ”仿真 实验 及 分 析 


用 Python 语言 开发 了 一 个 虚拟 机 放置 的 仿真 
平台 ,该 仿真 平台 可 以 读 取 数 据 、 处 理 数据 以 及 统计 
性 能 指标 。 提 出 的 算法 将 与 FFD 算法 外 .MBFD 算 
法 外 .BRC 算 法 [四 以 及 ALO 算法 在 能 耗资 源 利用 
率 、 资 源 碎片 .活动 物理 机 数量 等 几 个 方面 进行 对 比 。 
本 实验 的 环境 配置 :CPU 为 2.2 GHz 六 核 Intel Core 
17 ,内存 为 16 GiB, 操 作 系统 为 Mac OS,Python 版 本 
为 Python 3.7。 实 验 所 采用 的 数据 集 是 BitBrains 数 
据 集 -2 ,BitBrains 是 一 家 真实 的 数据 中 心 ,并 为 众多 
公司 提供 云 计算 服务 。 实 验 场景 选用 的 是 异 构 的 数 
据 中 心 并 选取 了 CPU 和 内 存 2 种 指标 ,数据 集 的 物 
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理 机 配置 如 表 1 所 示 。 25 
表 1 数据 中 心 的 物理 机 配置 四 
21 
CPU 核 数 内 存 /GiB 物理 机 数量 
24 32 10 
总 rs 
24 64 20 从 15 
24 128 20 13 
48 128 10 114 


实验 中 ,MALO 算法 的 种 群 数量 设置 为 200, 磷 
代 次 数 为 10。 待 放置 的 虚拟 机 数量 分 别 为 50, 60， 
70,80,90 以 及 100 台 。 数 据 中 心 的 物理 机 数量 为 60 
台 , 且 是 异 构 的 。 随 着 待 放 置 虚 拟 机 的 数量 不 断 增 
加 ,使 用 MALO 算法 进行 求解 时 维度 也 在 不 断 增 
加 为 了 保证 算法 求解 的 精度 尽 可 能 高 ,实验 采用 分 
批 误 置 , 即 以 10 台 虚 拟 机 为 一 组 进行 放置 ,以 此 类 
推 忆 其 他 对 比 算法 的 参数 均 采用 默认 配置 。 分 别 对 
比 移 种 算法 的 能 耗 、 物 理 机 开机 数量 .CPU 资源 利用 
刻 3 欣 存 资源 利用 率 、CPU 资源 碎片 以 及 内 存 资源 碎 
片 这 几 个 指标 。 


本 
3GN 能 耗 实验 


他 实验 对 比 了 MALO、ALO、BRC、FFD、MBFD 
天 宰 虚拟 机 放置 算法 的 能 耗 情况 以 及 各 算法 的 活跃 
物理 机 数量 。 在 对 能 耗 进行 统计 时 , 当 物 理 机 核心 数 
次 咒 、32、48、64 时 ,物理 机 对 应 的 峰值 功 耗 分 别 为 
0 人: 0、1.4、2.0 kW。 

.三 能 耗 实验 结果 如 图 1 所 示 , MALO 算法 能 耗 优 

加 外 4 种 算法 。 当 虚拟 机 数量 为 50~90 时 能 耗 最 
低 ,虚拟 机 数量 为 100 时 ,MALO 与 ALO 能 耗 相 同 。 
这 是 因为 在 数据 中 心 能 耗 与 物理 机 的 开机 数量 有 很 
强 的 相关 性 ,活跃 物理 机 的 数量 越 少 ,能 耗 一 般 也 越 
低 。 但 本 实验 是 在 异 构 的 数据 中 心 下 进行 的 ,因此 前 
弱 了 这 种 相关 性 。MALO 算法 在 ALO 算法 上 做 了 
一 些 改进 ,有 着 更 好 的 跳出 局 部 最 优 解 机 制 , 在 范围 
内 能 搜索 到 更 多 解 , 这 样 也 就 使 得 活跃 物理 机 的 数量 
减少 ,能 耗 相 比 其 他 几 种 算法 有 一 定 优势 。 

活跃 物理 机 的 数量 能 间接 反映 能 耗 高 低 , 通 常情 
况 下 活跃 物理 机 数量 越 少 ,能 耗 越 低 ,因此 降低 活跃 
物理 机 的 数量 是 解决 高 能 耗 问题 的 关键 。 图 2 为 这 


虚拟 机 数量 / 台 


图 1 数据 中 心 总 功 耗 对 比 


机 放置 在 遍历 过 程 中 第 一 台 满 足 需求 的 物理 机 上 ， 
MBFD 算法 是 将 虚拟 机 放置 在 能 耗 增加 最 少 的 物理 
机 上 ,BRC 算法 则 是 基于 资源 平衡 因子 和 资源 浪费 
得 到 一 个 合理 的 放置 方案 ,这 3 种 算法 未 尽 可 能 地 将 
多 台 虚 拟 机 往 同一 人 台 物 理 机 上 放置 ,从 而 减少 物理 机 
的 开机 数量 。 
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图 2 数据 中 心 活跃 物理 机 数量 对 比 


3.2 资源 利用 率 实 验 


资源 利用 率 是 衡量 一 个 数据 中 心虚 拟 机 放置 策 
略 好 坏 的 关键 指标 ,资源 利用 率 越 高 意味 着 每 台 主 机 
的 资源 利用 更 加 充分 ,虚拟 机 放置 策略 更 加 合理 。 图 
3、 图 4 分 别 为 各 算法 的 CPU、 内 存 利 用 率 的 情况 ,在 
CPU 利用 率 方面 ,在 大 多 数 虚 拟 机 规模 下 MALO 算 
法 都 具有 比较 明显 的 优势 。 而 在 内 存 利用 率 方面 , 当 
虚拟 机 规模 在 60 一 90 时 ,MALO 算法 内 存 利 用 率 最 


几 种 算法 的 活跃 物理 机 数量 ,可 以 看 出 随 着 待 放置 虚 
拟 机 数量 的 增加 ,MALO 算法 的 活跃 物理 机 数量 是 
最 低 的 , 当 虚 拟 机 数量 为 100 时 , MALO 算法 和 
ALO 算法 活跃 物理 机 数量 一 致 。 这 是 因为 MALO 
算法 相 比 ALO 算法 有 着 更 好 的 跳出 局 部 最 优 解 机 
制 ,有 利于 全 局 寻 优 。 而 FFD 算法 的 策略 是 将 虚拟 


高 ; 当 虚 拟 机 数量 为 50 时 ,内 存 利 用 率 低 于 MBFD 
算法 , 当 虚 拟 机 数量 为 100 时 ,内 存 利用 率 略 低 于 
ALO 算法 。 总 的 来 看 ,MALO 算法 在 资源 利用 率 上 
能 取得 较 好 的 效果 ,这 是 因为 MALO 算法 相 比 ALO 
算法 具有 更 好 的 跳出 局 部 最 优 解 机 制 ,能 避免 陷入 局 
部 最 优 解 , 而 FFD、MBFD 及 BRC 算法 没有 尽 可 能 
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在 一 台 物 理 机 上 放置 更 多 的 虚拟 机 ,虚拟 机 放置 较 分 
散 , 活 动物 理 机 的 数量 较 多 ,因此 ,CPU、 内 存 利用 率 
低 于 MALO 算法 。 


CPU 利用 率 
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© 图 3 数据 中 心 CPU 利用 率 对 比 
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OO 图 4 数据 中 心 内 存 利用 率 对 比 


3.3 资源 碎片 实验 


资源 碎片 是 衡量 数据 中 心虚 拟 机 放置 是 否 平衡 
的 一 个 重要 指标 。 如 果 一 台 物 理 机 上 的 虚拟 机 放置 
不 平衡 ,如 CPU 资源 用 完 而 内 存 资源 还 剩 很 多 , 就 
会 导致 无 法 再 放置 新 的 虚拟 机 ,资源 就 会 被 浪费 掉 ， 
这 也 是 导致 物理 机 资源 利用 率 低 下 的 一 个 重要 原因 。 
因此 ,通常 情况 下 资源 碎片 的 数量 越 少 , 主机 负载 就 
越 均 衡 ,数据 中 心 的 资源 利用 越 高 效 。 通 过 图 5、 图 6 
可 看 出 ,在 CPU 碎片 方面 ,MALO 算法 与 ALO 算 
法 效果 接近 ,在 大 多 数 虚 拟 机 规模 下 能 产生 更 少 的 
CPU 资源 碎片 。 而 在 内 存 碎 片 方面 ,MALO 算法 在 
效果 上 仅 次 于 FFD 算法 ,FEFD 算法 在 内 存 碎片 上 效 
果 比 较 明显 ,主要 是 因为 FFD 的 放置 策略 就 是 在 遍 
历 物理 机 列表 的 过 程 中 找到 首次 满足 虚拟 机 资源 请 
求 的 物理 机 就 进行 放置 ,导致 虚拟 机 放置 相对 比较 分 


散 ,这 样 也 就 减少 了 内 存 资 源 碎片 的 产生 。 综 合 来 
看 ,MALO 算法 在 资源 碎片 方面 总 体 上 能 取得 一 个 
较 好 的 效果 ,这 是 因为 MALO 算法 在 进行 放置 时 考 
虑 了 资源 平衡 度 , 使 得 放置 后 的 资源 平衡 度 尽 可 能 
小 ,从 而 减少 放置 不 平衡 情况 的 发 生 。 
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图 5 数据 中 心 CPU 资源 碎片 对 比 


内 存 资源 碎片 /个 
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6 数据 中 心 内 存 资源 碎片 对 比 


4 结束 语 


提出 了 一 种 基于 改进 蚁 狮 算法 的 虚拟 机 放置 方 
法 ,针对 能 耗 、 资 源 利用 率 及 资源 碎片 这 3 个 目标 进 
行 优化 。 在 蚁 狮 算法 的 基础 上 ,通过 在 蚂蚁 随机 游 走 
策略 上 引入 上 自 适应 边界 变化 机 制 ,并 且 改 进 蚂蚁 随机 
游 走 时 位 置 更 新 策略 ,使 得 种 群 的 多 样 性 大 大 增加 ， 
改进 后 的 蚁 狮 算法 有 更 好 的 跳出 局 部 最 优 解 机 制 。 
将 此 方法 应 用 在 虚拟 机 放置 的 场景 下 ,通过 与 男 外 4 
种 算法 的 对 比 实验 可 看 出 ,MALO 算法 在 降低 能 
提高 资源 利用 率 的 同时 ,也 能 在 一 定 程度 上 减少 资源 
碎片 的 产生 。 
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算法 
跳出 
在 虚 


在 未 来 的 工作 中 ,可 考虑 结合 蚁 群 算法 、 粒 子 群 
等 一 些 智能 优化 算法 的 策略 ,使 得 算法 有 更 好 的 
局 部 最 优 解 机 制 。 除 此 之 外 , 蚁 狮 算法 除了 应 用 
拟 机 放置 阶段 ,还 可 以 应 用 在 虚拟 机 迁移 过 程 


中 ,最 后 在 真实 环境 中 进一步 发 挥 蚁 狮 算法 的 作用 ， 


提高 
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Ceph 存储 系统 中 节点 的 容错 选择 算法 
夏 亚 楠 , 王 勇 


(桂林 电子 科技 大 学 计算 机 与 信息 安全 学 院 , 广 西 桂林 541004) 

摘 要 ;Ceph 分 布 式 系统 中 的 数据 分 布 算法 仅 将 容量 作为 选择 存储 节点 的 标准 ,并 未 考虑 存储 节点 的 网 络 状 态 和 节点 负 
载 。 在 副本 模式 下 , 当 三 副本 中 有 存储 节点 并 需要 修复 时 ,过 高 的 节点 负载 或 者 网 络 负 载 会 导致 较 大 的 节点 修复 时 延 。 针 
对 这 个 问题 ,给 出 了 一 种 基于 Ceph 的 节点 容错 选择 (FTNSC) 算 法 。 首 先 利 用 软件 定义 网 络 技术 获得 实时 的 网 络 状 态 和 节 
点 负载 信息 ,作为 节点 选择 方法 的 数据 支撑 ;然后 建立 综合 考虑 节点 负载 信息 的 多 属性 决策 数学 模型 来 确定 主 存 储 节 点 位 
置 ;最 后 通过 人 工蜂 群 算法 根据 与 主 存储 节点 之 间 的 网 络 状 态 和 节点 性 能 得 到 最 优 次 存储 节点 。 实 验 结果 表明 ,与 现 有 的 
“CRUSH 算法 相 比 , 该 算法 在 提高 数据 存储 节点 性 能 的 同时 ,将 失效 数据 的 修复 时 延 减少 2% ~29.7%。 

键 词 :Ceph; 软件 定义 网 络 ;多 属性 决策 ;人 工蜂 群 算法 ;副本 放置 ;容错 
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A fault tolerant nodes selection algorithm in Ceph storage System 


XIA Yanan，WANG Yong 


torage nodes, and does not consider the network state and node load of storage nodes. In the replica mode, when a Storage 


Bde in the three replicas needs to be repaired, too high node load or network load will lead to a large node repair delay. To 


-Eablisched to Po the location of the primary storage node; Finally, the artificial bee colony algorithm is used to ob- 


(on the optimal secondary storage node according to the network state and node performance with the primary storage node. 
Experimental results show that compared with the existing methods, the proposed method can improve the performance of 
data storage nodes and reduce the data repair delay when nodes fail. 


Key words: Ceph; SDN; multiple attribute decision; artificial bee colony algorithm; replica placement; fault tolerant 


随 着 信息 化 的 普及 ,各 行 各 业 每 天 产生 的 数据 量 


当前 主流 的 软 硬 平台 


都 在 以 指数 级 的 速度 快速 增长 ,预计 到 2025 年 ,全 球 
数据 量 相 较 2016 年 将 增加 10 倍 趾 。 传 统 的 存储 模 
式 已 经 无 法 应 对 海量 数据 的 存储 需求 ,而 分 布 式 存储 
系统 通过 廉价 的 商用 硬件 较 好 地 解决 了 这 一 问题 , 目 
前 投入 商业 使 用 的 有 OpenStack Swift、Amazon 
EBS Ceph 等 由。 其 中 ,Ceph 因 具 有 可 扩展 性 、 高 性 
存储 以 及 适用 范围 广 的 优势 ,被 广泛 应 用 于 
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作为 分 布 式 对 象 存储 典型 代表 , Ceph 最 初 由 
Weil 等 开发 提出 ,十 多 年 间 已 经 有 超过 100 家 公司 
(机 构 ) 研 究 与 使 用 Ceph, 其 中 包括 欧洲 原子 能 研究 
组 织 、Yahoo、 阿 里 巴巴 等 。 同 时 由 于 不 同 的 应 用 场 
景 对 存储 系统 的 关注 点 不 同 , 吸 引 许 多 学 人 
系列 针对 Ceph 性 能 优化 的 研究 ,主要 包括 读 写 性 和 
优化 .节点 工作 负载 优化 、 存 储 数 据 分 布 的 优化 等 方 
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